智能论文笔记

A Retrieve-and-Read Framework for Knowledge Graph Link Prediction

Vardaan Pahuja , Boshi Wang , Hugo Latapie , Jayanth Srinivasa , Yu Su

分类：自然语言处理 | 人工智能

2022-12-19

Knowledge graph (KG) link prediction aims to infer new facts based on existing facts in the KG. Recent studies have shown that using the graph neighborhood of a node via graph neural networks (GNNs) provides more useful information compared to just using the query information. Conventional GNNs for KG link prediction follow the standard message-passing paradigm on the entire KG, which leads to over-smoothing of representations and also limits their scalability. On a large scale, it becomes computationally expensive to aggregate useful information from the entire KG for inference. To address the limitations of existing KG link prediction frameworks, we propose a novel retrieve-and-read framework, which first retrieves a relevant subgraph context for the query and then jointly reasons over the context and the query with a high-capacity reader. As part of our exemplar instantiation for the new framework, we propose a novel Transformer-based GNN as the reader, which incorporates graph-based attention structure and cross-attention between query and context for deep fusion. This design enables the model to focus on salient context information relevant to the query. Empirical results on two standard KG link prediction datasets demonstrate the competitive performance of the proposed method.

translated by 谷歌翻译

Git Re-Basin: Merging Models modulo Permutation Symmetries

Samuel K. Ainsworth , Jonathan Hayase , Siddhartha Srinivasa

分类：机器学习 | 人工智能

2022-09-11

深度学习的成功归功于我们能够相对轻松地解决某些大规模的非凸优化问题。尽管非凸优化是NP硬化，但简单的算法（通常是随机梯度下降的变体）在拟合大型神经网络的实践中具有令人惊讶的有效性。我们认为，在考虑了所有可能的隐藏单元对称对称性之后，神经网络损失景观包含（几乎）一个盆地。我们介绍了三种算法以缩小一个模型的单元，以使它们与参考模型的单位保持一致。这种转换产生了一组功能等效的权重，该权重位于参考模型附近的大约凸盆地中。在实验上，我们证明了各种模型架构和数据集中的单个盆地现象，包括在CIFAR-10和CIFAR-100上独立训练的Resnet模型之间的第一个（据我们所知）的（据我们所知）的第一次演示。此外，我们确定了有趣的现象，将模型宽度和训练时间与各种模型和数据集的模式连接性有关。最后，我们讨论了单个盆地理论的缺点，包括对线性模式连接假设的反例。

translated by 谷歌翻译

Learning Continuous Implicit Representation for Near-Periodic Patterns

Bowei Chen , Tiancheng Zhi , Martial Hebert , Srinivasa G. Narasimhan

分类：计算机视觉 | 人工智能

2022-08-25

接近周期性的模式（NPP）在人造场景中无处不在，由瓷砖图案组成，其外观差异是由照明，缺陷或设计元素引起的。良好的NPP表示对许多应用程序有用，包括图像完成，分割和几何重新映射。但是代表NPP是具有挑战性的，因为它需要保持全球一致性（瓷砖图案布局），同时保留局部变化（外观差异）。使用大型数据集或单图像优化斗争在一般场景上训练的方法以满足这些约束，而明确模型周期性的方法对周期性检测错误并不强大。为了应对这些挑战，我们使用基于坐标的MLP学习具有单图像优化的神经隐式表示。我们设计一个输入功能翘曲模块和周期性指导的补丁损失，以处理全球一致性和局部变化。为了进一步提高鲁棒性，我们引入了一个周期性建议模块，以在我们的管道中搜索和使用多个候选周期。我们在单个和多平面场景上展示了我们方法对500多个建筑物，架子，壁纸，地面和蒙德里安图案的有效性。

translated by 谷歌翻译

A Low-Complexity Approach to Rate-Distortion Optimized Variable Bit-Rate Compression for Split DNN Computing

Parual Datta , Nilesh Ahuja , V. Srinivasa Somayazulu , Omesh Tickoo

分类：机器学习 | (统计)机器学习

2022-08-24

拆分计算已成为实现基于DNN的AI工作负载的最新范例，其中DNN模型分为两个部分，其中一个是在移动/客户端设备上执行的，另一部分是在边缘服务器（或cloud）上执行的。。数据压缩适用于需要传输的DNN的中间张量，以应对优化速率准确性复杂性权衡的挑战。现有的拆分计算方法采用基于ML的数据压缩，但要求将整个DNN模型的参数（或其中的大部分）用于不同的压缩级别。这会产生高的计算和存储负担：训练从头开始的完整DNN模型在计算上是要求的，维持DNN参数的多个副本会增加存储要求，并在推断期间切换全套权重增加内存带宽。在本文中，我们提出了一种解决所有这些挑战的方法。它涉及瓶颈单元的系统设计和训练 - 简单，低成本的神经网络 - 可以在分裂点插入。与现有方法相比，在训练和推理期间，在训练和推理期间，高效和储存额的一小部分，我们的方法都非常轻巧。

translated by 谷歌翻译

HTML版本

AI for Global Climate Cooperation: Modeling Global Climate Negotiations, Agreements, and Long-Term Cooperation in RICE-N

Tianyu Zhang , Andrew Williams , Soham Phade , Sunil Srinivasa , Yang Zhang , Prateek Gupta , Yoshua Bengio , Stephan Zheng

分类：机器学习

2022-08-15

全球综合合作对于限制全球温度的升高至关重要，同时继续经济发展，例如减少严重的不平等或实现长期经济增长。与N战略代理进行缓解气候变化的长期合作提出了一个复杂的游戏理论问题。例如，代理商可以谈判并达成气候协议，但是没有中央权力可以执行遵守这些协议。因此，设计谈判和协议框架以促进合作，允许所有代理人达到其个人政策目标并激励长期遵守，这一点至关重要。这是一个跨学科的挑战，要求在机器学习，经济学，气候科学，法律，政策，道德和其他领域进行研究人员之间的合作。特别是，我们认为机器学习是解决该领域复杂性的关键工具。为了促进这项研究，在这里，我们介绍了一个多区域综合评估模型，模拟全球气候和经济，可用于设计和评估不同谈判和协议框架的战略成果。我们还描述了如何使用多代理增强学习来使用水稻N训练理性剂。该框架是全球气候合作的基础，这是一个工作组协作和气候谈判和协议设计的竞争。在这里，我们邀请科学界使用Rice-N，机器学习，经济直觉和其他领域知识来设计和评估其解决方案。更多信息可以在www.ai4climatecoop.org上找到。

translated by 谷歌翻译

What is it like to program with artificial intelligence?

Advait Sarkar , Andrew D. Gordon , Carina Negreanu , Christian Poelitz , Sruti Srinivasa Ragavan , Ben Zorn

分类：人工智能

2022-08-12

大型语言模型，例如OpenAI的法典和DeepMind的字母，可以生成代码来解决以自然语言表达的各种问题。这项技术已经在至少一项广泛使用的编程编辑器扩展程序中进行了商业化：Github Copilot。在本文中，我们探讨了具有大型语言模型（LLM辅助编程）的编程与程序员协助的先前概念化相似，并且与众不同。我们借鉴了公开可用的经验报告，有关LLM辅助编程以及先前的可用性和设计研究。我们发现，尽管LLM辅助编程通过搜索和重用分享了一些编译，配对编程和编程的属性，但技术可能性和实践经验都存在根本差异。因此，应该将LLM辅助编程视为具有自己独特的属性和挑战的新方法。最后，我们借鉴了用户研究的观察结果，在该观察中，非专家最终用户程序员使用LLM辅助工具来求解电子表格中的数据任务。我们讨论可能出现的问题，并在将大型语言模型应用于最终用户编程时，尤其是对于几乎没有编程专业知识的用户。

translated by 谷歌翻译

Deep learning based non-contact physiological monitoring in Neonatal Intensive Care Unit

Nicky Nirlipta Sahoo , Balamurali Murugesan , Ayantika Das , Srinivasa Karthik , Keerthi Ram , Steffen Leonhardt , Jayaraj Joseph , Mohanasankar Sivaprakasam

分类：计算机视觉

2022-07-25

新生儿重症监护病房（NICU）中的早产婴儿必须不断监测其心脏健康。常规的监测方法是基于接触的，使新生儿容易受到各种医院感染。基于视频的监视方法为非接触式测量开辟了潜在的途径。这项工作提供了一条管道，用于远程对NICU设置视频的心肺信号进行远程估算。我们提出了一个端到端深度学习（DL）模型，该模型集成了一种基于基于学习的方法来生成替代地面真理（SGT）标签以进行监督，从而避免了直接依赖对真实地面真相标签的依赖。我们进行了扩展的定性和定量分析，以检查我们提出的基于DL的管道的功效，并在估计的心率中达到了总平均平均绝对误差为4.6 BEATS（BPM）（BPM）和均方根均方根误差为6.2 bpm。

translated by 谷歌翻译

Iterative Linear Quadratic Optimization for Nonlinear Control: Differentiable Programming Algorithmic Templates

Vincent Roulet , Siddhartha Srinivasa , Maryam Fazel , Zaid Harchaoui

分类：机器学习

2022-07-13

我们介绍了基于目标观点的线性和二次近似值的非线性控制算法的实现。我们提出了一种梯度下降，一种高斯 - 纽顿方法，一种牛顿方法，具有线性二次或二次近似值的差分动态编程方法，各种线路搜索策略以及这些算法的正则变体。我们在可区分的编程框架中得出所有算法的计算复杂性，并提出足够的最佳条件。我们比较了几个基准的算法，例如使用汽车的自行车模型进行自动驾驶。该算法用公开可用的软件包中的可区分编程语言进行编码。

translated by 谷歌翻译

A Solver + Gradient Descent Training Algorithm for Deep Neural Networks

Dhananjay Ashok , Vineel Nagisetty , Christopher Srinivasa , Vijay Ganesh

分类：机器学习

2022-07-07

我们提出了一种用于训练深神经网络的新型混合算法，该算法将最先进的梯度下降（GD）方法与混合整数线性编程（MILP）求解器相结合，以准确性以及变体的差异以及变体，以及回归和分类任务的资源和数据效率。我们的GD+求解器混合算法称为GDSolver，工作如下：给定DNN $ d $作为输入，GDSolver召集GD派出部分训练$ d $，直到卡在当地的最小值中，这一点GDSOLVER将Milp Solver召集到一定程度上详尽地搜索损失景观的区域，围绕$ d $的最后一层参数的重量分配，目的是贯穿并逃脱本地的最小值。重复该过程，直到达到所需的准确性。在我们的实验中，我们发现GDSolver不仅可以很好地扩展到其他数据和非常大的模型大小，而且还优于收敛和数据效率率的所有其他竞争方法。对于回归任务，GDOLVER生产的模型平均在48％的时间内降低了31.5％，并且对于MNIST和CIFAR10的分类任务，GDSOLVER仅使用所有竞争方法就能达到最高精度，仅使用50％ GD基准需要的培训数据。

translated by 谷歌翻译

Artifact Reduction in Fundus Imaging using Cycle Consistent Adversarial Neural Networks

Sai Koushik S S , K. G. Srinivasa

分类：计算机视觉 | 机器学习

2021-12-25

眼底图像对于鉴定各种眼科疾病非常有用。然而，由于伪影存在，视网膜的可见性受到严重影响。这可能导致可能导致更复杂的问题的疾病误诊。由于深度学习是一种强大的工具，可以在没有人为干预的情况下从数据中提取模式，它们可以应用于图像到图像图像到图像的翻译问题。本文已经尝试了，以自动纠正眼底图像中存在的伪像。我们使用基于Cnercangan的模型，该模型由残余块组成，以减少图像中的伪影。与现有技术相比，可以看到显着的改进。

translated by 谷歌翻译